查看原文
其他

实用工具 | 6款免费OCR工具,第一款是神器

Jackpop 平凡而诗意 2022-08-19

每当工作和学习中遇到PDF文档和文字图片时,都会非常令人头疼。重复性且无异议的劳动,让人心力憔悴,随着OCR技术的成熟,越来越多的人开始考虑利用OCR解决PDF和图片文字识别问题。近两年OCR方面的工具层出不穷,但是真正经得起考验的却少之又少,大多数都是借势营销、汲取利益的噱头,本文就来介绍6款强大的OCR工具,覆盖网页端、PC端、手机端,总有一款适合你,文末有下载方式

本期内容

图片和PDF是我们日常学习和工作过程中接触较多的文件存储方式,它的确对数据的传输和内容的安全性带来了便利,但是,也为内容使用带来了一定的麻烦--需要重复性的劳动

每当我们需要PDF或者图片中的文字,用于编辑或者翻译时,这时候就开始让人头疼,暴力复制会引起很多格式的错乱,最终只能无奈的重新输入一遍。重新输入对于篇幅较小的可以考虑,但是对于内容较多的却让人望而却步。

随着这两年OCR[1](Optical Character Recognition,光学字符识别)技术的成熟,越来越多的人开始考虑利用OCR来解决上述问题。因此,OCR相关的工具如同雨后春笋一样,层出不穷。这里面不乏有非常实用的工具,但是,我更愿意用群魔乱舞来形容当下的OCR工具。

有一些工具曾经以免费出道,风靡一时,然后开始推出收费版,而免费版的就如同废弃品一样,让人惨不忍睹,比如之前风靡一时的天若OCR

也有一些甚至不如天若OCR的工具,从一开始就变小的不堪入目,识别结果乱七八糟,稳定性非常差。

经过一段时间的试用和对比,我精挑细选出6款OCR工具,其中,包括2款网页端2款PC端2款手机端,总有一款适合你。

网页端

ocr.space

ocr.space[2]是一款值得大书特书,且真正惊艳到我的OCR工具,甚至可以说,有了ocr.space,后面的5款可以选择性的忽略。

目前大多数OCR工具都会受限于以下几个弊端,

•仅支持图片识别•免费次数有限•支持语言较少

而这里要介绍的ocr.space,可以当之无愧的称得上Best Free OCR,它有如下几项让人眼前一亮的优点:

支持格式多:支持JPG、PNG、GIF、PDF、URL等作为输入。支持语言多:支持英语、中文、法语、德语等20+种语言。免费:ocr.space的免费是不限次数的免费。

正是因为它的强大,所以,很多其他OCR工具都用它作为API进行二次开发封装成工具,例如,后面要介绍的ShareX

ocr.space使用方法非常简单,只需要可以直接上传PDF和图片,也可以粘贴它们的链接,然后选择要识别的语言,其它选项默认,点击Star OCR!即可。

极客OCR

极客OCR[3]同样是一款免费的网页端OCR工具,但是,需要指出的是,它的免费是限制次数的,每天限制上传10张图像,另外,极客OCR相对于ocr.space也有一点不足就是,它只支持图片格式不支持PDF

但是,既然介绍它,说明它也有自身的优势,

•支持46种语言•支持多种输出格式

极客OCR支持的语言要比ocr.space多一些,如果格式为图像,且ocr.space不支持相应的语言,可以考虑极客OCR。另外,它的使用方式也相对简洁明了,

•上传图像•选择输出格式•开始转换

PC端

ShareX

ShareX[4]是一款完全免费开源的工具。

严格意义上来讲,ShareX并不是纯粹的OCR工具,反而,称其为截图工具更为合适,我在前面一篇介绍截图工具时曾经提到过ShareX。

但是,我还是希望再次以OCR工具的身份再次介绍这款工具,因为,在OCR功能方面,它同样要明显优于大多数工具。

ShareX有如下几点优势,

•完全免费•功能丰富

ShareX是一款以截图为发起点,可以选择一系列连续动作的复合工具。你可以选择截图后上传、截图后保存、截图后加水印、截图后扫描二维码

当然,也可以选择截图后文字识别,这样,它就成了一款OCR工具了。

树洞OCR

树洞OCR[5]和ShareX有两点相似之处,

•支持截图识别•完全免费

树洞OCR除了支持截图识别之外,还可以上传图片。除上述两点之外,还有两点非常吸引我,

•跨平台,支持MacOS•支持换行

首先说一下第一点,目前支持Android、iOS、Windows三个平台的OCR工具非常多,但是,支持MacOSSierra的却屈指可数,我觉得这就是我在这里介绍树洞OCR的主要原因之一。

其次,支持换行,当我阅读英文文献时,解决OCR识别问题可以选择上述工具,但是,我想要翻译时还有一个不可忽视的点--换行符,如果直接拷贝OCR识别结果去谷歌、百度翻译,会发现非常混乱,这时候就不得不逐个删除换行符。

因此,对于经常阅读PDF格式英文文献的同学,可以考虑使用树洞OCR。

手机端

洋果扫描王

手机APP是很多公司抢占的热门方向,OCR工具自然不会逃脱善于抓住商机的眼光。

手机端OCR工具相对于网页端、PC端都要多很多,但是,付费软件所占的比例也要高很多。

洋果扫描王可以称得上是一个另类,它完全免费,不限次数的免费

另外,洋果扫描王不单纯是一款OCR工具,它更像是一款百宝箱,它支持但不限于以下几项功能,

•文字识别•翻译•人脸测试•花草识别•证件识别•车型识别

这里尤其需要着重介绍的就是文字识别翻译

我们可以直接以拍照和选择图片的方式识别图片中的文字,然后可以直接进行翻译,另外,翻译方面它支持中文、日语、英语、韩语、法语等语言。

白描

白描是一款商业化更重的一款APP,之所以称其为商业化重是因为,它包括普通版和会员版,普通版每天限制识别5次,我认为这对大多数用户已经足够使用了。

白描商业化更重,为什么还要在这里推荐呢?

因为,更重的商业化,同时带来的就是更加的用户体验,它识别准确率更高、速度更快。此外,还支持拍照翻译文字、文件转录、身份证识别、购物小票识别、截图文字提取、纸质文件电子化等使用功能。

当然,就如同前面所说的那样,我认为白描免费用户每天5次识别已经能够满足大多数用户的使用,因此,我们也可以把它视为一款免费软件。

下载方式

我把上述2款PC端工具和2款手机端工具进行共享了,如果需要,可以关注公众号“平凡而诗意”回复关键字“ocr”获取。

推荐阅读

抛弃bash,拥抱zsh!实用工具 | 一款丰富强大的Python绘图工具Python参数配置库ConfigParser详解迫不及待把这款开发神器推荐给大家!PyHubWeekly | 第四期:清理无效代码,给你的项目瘦瘦身吧!PyHubWeekly | 第五期:秒级处理十亿级表格数据


欢迎关注我的公众号“”,原创技术文章第一时间推送,如果觉得喜欢,麻烦点击一下“在看”~

引用链接

[1] OCR: https://baike.baidu.com/item/%E5%85%89%E5%AD%A6%E5%AD%97%E7%AC%A6%E8%AF%86%E5%88%AB/4162921?fromtitle=OCR&fromid=25995&fr=aladdin
[2] ocr.space: http://ocr.space/
[3] 极客OCR: http://www.gkocr.com/web/index.html
[4] ShareX: https://github.com/ShareX/ShareX/releases/tag/v13.0.1
[5] 树洞OCR: https://github.com/AnyListen/tools-ocr

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存